智能论文笔记

EBHI-Seg: A Novel Enteroscope Biopsy Histopathological Haematoxylin and Eosin Image Dataset for Image Segmentation Tasks

Liyu Shi , Xiaoyan Li , Weiming Hua , Haoyuan Chen , Jing Chen , Zizhen Fan , Minghe Gao , Yujie Jing , Guotao Lu , Deguo Ma

分类：计算机视觉

2022-12-01

Background and Purpose: Colorectal cancer is a common fatal malignancy, the fourth most common cancer in men, and the third most common cancer in women worldwide. Timely detection of cancer in its early stages is essential for treating the disease. Currently, there is a lack of datasets for histopathological image segmentation of rectal cancer, which often hampers the assessment accuracy when computer technology is used to aid in diagnosis. Methods: This present study provided a new publicly available Enteroscope Biopsy Histopathological Hematoxylin and Eosin Image Dataset for Image Segmentation Tasks (EBHI-Seg). To demonstrate the validity and extensiveness of EBHI-Seg, the experimental results for EBHI-Seg are evaluated using classical machine learning methods and deep learning methods. Results: The experimental results showed that deep learning methods had a better image segmentation performance when utilizing EBHI-Seg. The maximum accuracy of the Dice evaluation metric for the classical machine learning method is 0.948, while the Dice evaluation metric for the deep learning method is 0.965. Conclusion: This publicly available dataset contained 5,170 images of six types of tumor differentiation stages and the corresponding ground truth images. The dataset can provide researchers with new segmentation algorithms for medical diagnosis of colorectal cancer, which can be used in the clinical setting to help doctors and patients.

translated by 谷歌翻译

Communication-Efficient Decentralized Online Continuous DR-Submodular Maximization

Qixin Zhang , Zengde Deng , Xiangru Jian , Zaiyi Chen , Haoyuan Hu , Yu Yang

分类：机器学习

2022-08-18

最大化单调性函数是机器学习，经济学和统计数据中的一项基本任务。在本文中，我们提出了单调连续DR-submodular最大化问题的两种通信效率分散的在线算法，这两者都减少了函数梯度评估的数量，并从$ t^{3/2}中降低了每轮的通信复杂性$至$ 1 $。第一个，单发的分散式元弗兰克 - 沃尔夫（Mono-dmfw），达到了$（1-1/e）$ - 遗憾的是$ o（t^{4/5}）$。据我们所知，这是单调连续DR-submodular Maximization的第一个单发和无投射分散的在线算法。接下来，受到非界化的增强功能\ citep {zhang2022boosting}的启发，我们提出了分散的在线增强梯度上升（dobga）算法，该算法获得了$（1-1/e）$ - 遗憾的是$（\ sqrt {\ sqrt { t}）$。据我们所知，这是获得$（1-1/e）$的最佳$ o（\ sqrt {t}）$的第一个结果步。最后，各种实验结果证实了所提出的方法的有效性。

translated by 谷歌翻译

Online Learning for Non-monotone Submodular Maximization: From Full Information to Bandit Feedback

Qixin Zhang , Zengde Deng , Zaiyi Chen , Kuangqi Zhou , Haoyuan Hu , Yu Yang

分类：机器学习

2022-08-16

在本文中，我们在下闭合的凸套装上重新审视了在线非单调的DR-Submodular Mavimivel问题，该凸套装在机器学习，经济学和操作研究的领域中找到了广泛的现实世界应用。首先，我们以$ o（\ sqrt {t}）$的价格呈现元MFW算法，价格为$ t^{3/2} $每回合。据我们所知，Meta-MFW是第一个获得$ 1/e $ - regret $ o（\ sqrt {t}）$的算法放。此外，与ODC算法\ citep {thang2021online}形成鲜明对比的是，meta-mfw依赖于简单的在线线性甲骨文而无需离散化，提升或舍入操作。考虑到实用限制，我们然后提出了单声道-MFW算法，该算法将每个功能的随机梯度评估从$ t^{3/2} $减少到1，并实现$ 1/e $ -e $ -e-regret BOND $ O（t ^{4/5}）$。接下来，我们将Mono-MFW扩展到Bandit设置，并提出Bandit-MFW算法，该算法获得了$ 1/e $ - regret键的$ O（t^{8/9}）$。据我们所知，Mono-MFW和Bandit-MFW是第一个探索在线非占用dr dr-submodumarmimization thy pownlosed convex set的sumblinear-regret算法，可以探索单发和强盗设置。最后，我们对合成数据集和现实数据集进行了数值实验，以验证我们方法的有效性。

translated by 谷歌翻译

IL-MCAM: An interactive learning and multi-channel attention mechanism-based weakly supervised colorectal histopathology image classification approach

Haoyuan Chen , Chen Li , Xiaoyan Li , Md Mamunur Rahaman , Weiming Hu , Yixin Li , Wanli Liu , Changhao Sun , Hongzan Sun , Xinyu Huang

分类：计算机视觉

2022-06-07

近年来，大肠癌已成为危害人类健康最重要的疾病之一。深度学习方法对于结直肠组织病理学图像的分类越来越重要。但是，现有方法更多地集中在使用计算机而不是人类计算机交互的端到端自动分类。在本文中，我们提出了一个IL-MCAM框架。它基于注意机制和互动学习。提出的IL-MCAM框架包括两个阶段：自动学习（AL）和交互性学习（IL）。在AL阶段，使用包含三种不同注意机制通道和卷积神经网络的多通道注意机制模型用于提取多通道特征进行分类。在IL阶段，提出的IL-MCAM框架不断地将错误分类的图像添加到交互式方法中，从而提高了MCAM模型的分类能力。我们对数据集进行了比较实验，并在HE-NCT-CRC-100K数据集上进行了扩展实验，以验证拟议的IL-MCAM框架的性能，分别达到98.98％和99.77％的分类精度。此外，我们进行了消融实验和互换性实验，以验证三个通道的能力和互换性。实验结果表明，所提出的IL-MCAM框架在结直肠组织病理学图像分类任务中具有出色的性能。

translated by 谷歌翻译

Online Allocation with Two-sided Resource Constraints

Qixin Zhang , Wenbing Ye , Zaiyi Chen , Haoyuan Hu , Enhong Chen , Yang Yu

分类：机器学习

2021-12-28

由于许多有趣的现实世界应用在物流和在线广告中，我们考虑一个在线分配问题，受降低资源和上部资源限制，请求顺序到达，取样I.I.D。从未知的分发，我们需要及时判断有限的资源和下限要求。首先，了解可行性的衡量标准，即$ \ Alpha $，我们提出了一种新的算法，该算法获得1美元（\ frac {\ epsilon} {\ alpha-\ epsilon}）$-offline问题的竞争率这提前了解整个请求。灵感来自先前的研究，该算法采用了一种创新的技术来动态更新阈值价格向量以进行决策。此外，提出了估计可行性最佳测量的优化方法，并在本文末尾的理论保证。基于此方法，如果我们容忍与参数$ \ eta $的略微违反下限约束，则该算法自然地扩展到设置而不具有强烈可行的假设，这涵盖了显着的无法探索的不可行情景。

translated by 谷歌翻译

GasHisSDB: A New Gastric Histopathology Image Dataset for Computer Aided Diagnosis of Gastric Cancer

Weiming Hu , Chen Li , Xiaoyan Li , Md Mamunur Rahaman , Jiquan Ma , Yong Zhang , Haoyuan Chen , Wanli Liu , Changhao Sun , Yudong Yao

分类：计算机视觉

2021-06-04

背景和目的：胃癌已经成为全球第五次常见的癌症，早期检测胃癌对于拯救生命至关重要。胃癌的组织病理学检查是诊断胃癌的金标准。然而，计算机辅助诊断技术是挑战，以评估由于公开胃组织病理学图像数据集的稀缺而评估。方法：在本文中，公布了一种贵族公共胃组织病理学子尺寸图像数据库（GashissdB）以识别分类器的性能。具体地，包括两种类型的数据：正常和异常，总共245,196个组织案例图像。为了证明图像分类领域的不同时期的方法在GashissdB上具有差异，我们选择各种分类器进行评估。选择七种古典机器学习分类器，三个卷积神经网络分类器和新颖的基于变压器的分类器进行测试，用于测试图像分类任务。结果：本研究采用传统机器学习和深入学习方法进行了广泛的实验，以证明不同时期的方法对GashissdB具有差异。传统的机器学习实现了86.08％的最佳精度率，最低仅为41.12％。深度学习的最佳准确性达到96.47％，最低为86.21％。分类器的精度率显着变化。结论：据我们所知，它是第一个公开的胃癌组织病理学数据集，包含大量的弱监督学习的图像。我们认为Gashissdb可以吸引研究人员来探索胃癌自动诊断的新算法，这可以帮助医生和临床环境中的患者。

translated by 谷歌翻译

Is the aspect ratio of cells important in deep learning? A robust comparison of deep learning methods for multi-scale cytopathology cell image classification: from convolutional neural networks to visual transformers

Wanli Liu , Chen Li , Md Mamunur Rahamana , Tao Jiang , Hongzan Sun , Xiangchen Wu , Weiming Hu , Haoyuan Chen , Changhao Sun , Yudong Yao

分类：计算机视觉

2021-05-16

宫颈癌是女性中一种非常常见和致命的癌症类型。细胞病理学图像通常用于筛选这种癌症。鉴于在手动筛查期间可能发生许多错误，已经开发了一种基于深度学习的计算机辅助诊断系统。深度学习方法需要输入图像的固定维度，但临床医学图像的尺寸不一致。图像的纵横比在直接调整它们的同时受到影响。临床上，细胞病理学图像内的细胞的纵横比为医生诊断癌症提供重要信息。因此，很难直接调整大小。然而，许多现有研究直接调整了图像的大小，并获得了高度稳健的分类结果。为了确定合理的解释，我们进行了一系列比较实验。首先，预处理SipakMed数据集的原始数据以获得标准和缩放数据集。然后，将数据集调整为224 x 224像素。最后，22种深度学习模型用于分类标准和缩放数据集。该研究的结果表明，深度学习模型对宫颈细胞病理学图像中细胞的纵横比变化是鲁棒的。此结论也通过Herlev DataSet验证。

translated by 谷歌翻译

GasHis-Transformer: A Multi-scale Visual Transformer Approach for Gastric Histopathology Image Classification

Haoyuan Chen , Chen Li , Xiaoyan Li , Ge Wang , Weiming Hu , Yixin Li , Wanli Liu , Changhao Sun , Yudong Yao , Yueyang Teng

分类：计算机视觉

2021-04-29

现有的胃癌诊断深层学习方法，常用卷积神经网络。最近，视觉变压器由于其性能和效率而引起了极大的关注，但其应用主要在计算机视野领域。本文提出了一种用于Gashis变压器的多尺度视觉变压器模型，用于胃组织病理学图像分类（GHIC），其使微观胃图像自动分类为异常和正常情况。 GASHIS-COMPURANCER模型由两个关键模块组成：全球信息模块和局部信息模块有效提取组织病理特征。在我们的实验中，具有280个异常和正常图像的公共血毒素和曙红（H＆E）染色的胃组织病理学数据集分为训练，验证和测试组，比率为1：1：2胃组织病理学数据集测试组精度，召回，F1分数和准确性分别为98.0％，100.0％，96.0％和98.0％。此外，进行了关键的研究以评估Gashis变压器的稳健性，其中添加了10个不同的噪声，包括四种对抗性攻击和六种传统图像噪声。此外，执行临床上有意义的研究以测试Gashis变压器的胃肠癌鉴定性能，具有620个异常图像，精度达到96.8％。最后，进行比较研究以测试在淋巴瘤图像数据集和乳腺癌数据集上的H＆E和免疫组织化学染色图像的概括性，产生可比的F1分数（85.6％和82.8％）和精度（83.9％和89.4％），分别。总之，Gashistransformer演示了高分类性能，并在GHIC任务中显示出其显着潜力。

translated by 谷歌翻译

Zebra: Deeply Integrating System-Level Provenance Search and Tracking for Efficient Attack Investigation

Xinyu Yang , Haoyuan Liu , Ziyu Wang , Peng Gao

分类：自然语言处理

2022-11-10

System auditing has emerged as a key approach for monitoring system call events and investigating sophisticated attacks. Based on the collected audit logs, research has proposed to search for attack patterns or track the causal dependencies of system events to reveal the attack sequence. However, existing approaches either cannot reveal long-range attack sequences or suffer from the dependency explosion problem due to a lack of focus on attack-relevant parts, and thus are insufficient for investigating complex attacks. To bridge the gap, we propose Zebra, a system that synergistically integrates attack pattern search and causal dependency tracking for efficient attack investigation. With Zebra, security analysts can alternate between search and tracking to reveal the entire attack sequence in a progressive, user-guided manner, while mitigating the dependency explosion problem by prioritizing the attack-relevant parts. To enable this, Zebra provides (1) an expressive and concise domain-specific language, Tstl, for performing various types of search and tracking analyses, and (2) an optimized language execution engine for efficient execution over a big amount of auditing data. Evaluations on a broad set of attack cases demonstrate the effectiveness of Zebra in facilitating a timely attack investigation.

translated by 谷歌翻译

Video-Guided Curriculum Learning for Spoken Video Grounding

Yan Xia , Zhou Zhao , Shangwei Ye , Yang Zhao , Haoyuan Li , Yi Ren

分类：计算机视觉 | 自然语言处理

2022-09-01

在本文中，我们介绍了一项新任务，口语视频接地（SVG），旨在将口语描述中所需的视频片段定位。与使用文本相比，使用音频需要模型直接利用与原始语音视频相关的有用音素和音节。此外，我们在语音音频中随机添加环境声音，进一步增加了此任务的困难并更好地模拟真实应用程序。为了纠正歧视性音素并从嘈杂的音频中提取与视频相关的信息，我们在音频预训练过程中开发了一种新颖的视频指导课程学习（VGCL），可以利用重要的视觉感知来帮助理解口语语言并抑制外部噪音。考虑到推理期间，模型无法获得地面真实视频片段，我们设计了一种课程策略，该策略将输入视频从地面真相转移到预训练期间的整个视频内容。最后，该模型可以学习如何从整个视频剪辑中提取关键的视觉信息，以帮助了解口语。此外，我们基于ActivityNet收集了第一个大规模口语视频接地数据集，该数据集称为ActivityNet语音数据集。广泛的实验表明，我们提出的视频指导课程学习可以促进预训练过程以获得相互的音频编码器，从而大大促进了口头视频接地任务的性能。此外，我们证明，在嘈杂的声音的情况下，我们的模型优于将视频与ASR转录本扎根的方法，进一步证明了我们课程策略的有效性。

translated by 谷歌翻译

HTML版本